unlearning

大模型的遗忘也许是一个悖论?清华揭示Unlearning技术的两难困境

让大语言模型忘掉某件事,看似简单,实则比教它记住更难。Unlearning 技术旨在让模型遗忘特定的敏感数据、隐私信息或高风险知识,以降低潜在安全隐患。然而,这一过程正受到质疑:要么是模型忘不干净——被遗忘的内容往往能被轻量微调重新唤起;要么是模型忘得太狠——

模型 悖论 unlearning unlearning技术 2025-10-13 18:00  2